FIDとCLIP Scoreのトレードオフ
FID
生成された画像が実際の画像と似ていることを示す
低いほうが良い
CLIP Score
生成された画像が入力テキストと一致していることを示す
高いほうが良い
どちらかを最適化することに集中すると、もう片方のスコアが低下する可能性がある
CFG
を高くするとプロンプトに従うようになるけど、高すぎると生成画像が壊れていくのと同じような感じ?
nomadoor.icon